媒体覆盖范围对公众对事件的看法具有实质性影响。媒体框架事件的方式可以显着改变对社会的信仰和看法。尽管如此,众所周知,几乎所有媒体网点都以偏见的方式报告新闻。虽然可以通过改变单词选择或省略信息来引入这种偏差,但是偏差的感知也很大程度上取决于读者的个人背景。因此,媒体偏差是一个非常复杂的构造,用于识别和分析。尽管媒体偏见是许多研究的主题,但之前的评估策略过于简化,缺乏重叠和实证评估。因此,本研究旨在开发一种可以用作可靠标准来评估物品偏差的规模。为了命名一个例子:如果我们要问,打算衡量新闻文章中的偏见,“文章有多偏见?”或者我们应该改用,“文章是如何对待美国总统的?”。我们进行了文献搜索,以查找有关先前对该主题的文本看法的相关问题。在一个多迭代过程中,我们首先总结并缩小了这些问题,以结束关于偏见的完整和代表可能的问题类型。最终组由25个问题组成,答案格式不同,使用语义差异的17个问题,以及六个感受评级。我们在190条文章中测试了每个问题,总体上有663名参与者来确定问题衡量文章的感知偏见的程度。我们的研究结果表明,21项最终物品适合,可靠,以测量媒体偏差的看法。我们在http://bias -question-tree.gipplab.org/上发布最后一组问题。
translated by 谷歌翻译
Our goal with this survey is to provide an overview of the state of the art deep learning technologies for face generation and editing. We will cover popular latest architectures and discuss key ideas that make them work, such as inversion, latent representation, loss functions, training procedures, editing methods, and cross domain style transfer. We particularly focus on GAN-based architectures that have culminated in the StyleGAN approaches, which allow generation of high-quality face images and offer rich interfaces for controllable semantics editing and preserving photo quality. We aim to provide an entry point into the field for readers that have basic knowledge about the field of deep learning and are looking for an accessible introduction and overview.
translated by 谷歌翻译
Recent neural rendering approaches greatly improve image quality, reaching near photorealism. However, the underlying neural networks have high runtime, precluding telepresence and virtual reality applications that require high resolution at low latency. The sequential dependency of layers in deep networks makes their optimization difficult. We break this dependency by caching information from the previous frame to speed up the processing of the current one with an implicit warp. The warping with a shallow network reduces latency and the caching operations can further be parallelized to improve the frame rate. In contrast to existing temporal neural networks, ours is tailored for the task of rendering novel views of faces by conditioning on the change of the underlying surface mesh. We test the approach on view-dependent rendering of 3D portrait avatars, as needed for telepresence, on established benchmark sequences. Warping reduces latency by 70$\%$ (from 49.4ms to 14.9ms on commodity GPUs) and scales frame rates accordingly over multiple GPUs while reducing image quality by only 1$\%$, making it suitable as part of end-to-end view-dependent 3D teleconferencing applications. Our project page can be found at: https://yu-frank.github.io/lowlatency/.
translated by 谷歌翻译
在预测和健康管理(PHM)领域内,可以使用健康指标(HI)来帮助生产,例如安排维护并避免失败。但是,HI通常经过特定的过程设计,通常需要大量的历史数据进行设置。对于中小企业来说,这尤其是一个挑战,这种挑战通常缺乏足够的资源和知识来从PHM中受益。在本文中,我们提出了Modularhi,这是在没有历史数据的系统的HI构建中的模块化方法。使用ModularHi,操作员可以选择哪些传感器输入可用,然后Modularhi将根据在燃烧状态期间收集的数据计算基线模型。然后,该基线模型将用于检测系统是否随着时间的推移开始降解。我们在两个开放数据集,CMAPS和N-CMAPS上测试模块化。以前数据集的结果展示了我们系统检测降解的能力,而后者的结果是在该区域内进行进一步研究的方向。结果表明,我们的新方法能够在没有历史数据的情况下检测系统降解。
translated by 谷歌翻译
在形状分析中,基本问题之一是在计算这些形状之间的(地球)距离之前对齐曲线或表面。为了找到最佳的重新训练,实现这种比对的是一项计算要求的任务,它导致了在差异组上的优化问题。在本文中,我们通过组成基本差异性来解决近似问题,构建了定向性扩散的近似值。我们提出了一种在Pytorch中实施的实用算法,该算法既适用于未参考的曲线和表面。我们得出了通用近似结果,并获得了获得的差异形态成分的Lipschitz常数的边界。
translated by 谷歌翻译
在www.aicrowd.com平台上托管的学习竞赛自主赛车虚拟挑战由两个曲目组成:单摄像头和多相机。我们的Uniteam团队是单个相机轨道中的最终获胜者之一。该代理必须在最短时间内通过以前未知的F1风格轨道,而越野驾驶量最少。在我们的方法中,我们将U-NET体系结构用于道路细分,各种自动编码器编码道路二进制面具以及最近的邻居搜索策略,该策略选择给定状态的最佳动作。我们的经纪人在第1阶段(已知赛道)的平均速度为105 km/h,在第2阶段(未知轨道)上达到了73 km/h,而没有任何越野驾驶。在这里,我们提出解决方案和结果。代码实施可在此处提供:https://gitlab.aicrowd.com/shivansh beohar/l2r
translated by 谷歌翻译
神经辐射场(NERFS)增加了新型视图合成和场景重建的重建细节,其应用程序从大型静态场景到动态人类运动不等。但是,此类神经领域的分辨率和无模型性质的增加是以高训练时间和过度记忆要求为代价的。最近的进步通过使用互补的数据结构改善了推理时间,但这些方法不适合动态场景,并且通常会增加记忆消耗。减少培训时所需的资源几乎没有做到。我们提出了一种方法,通过部分共享相邻样本点的评估来利用NERF基于样本的计算的冗余。我们的UNERF体系结构的灵感来自UNET,该架构在网络中间减少空间分辨率,并在相邻样本之间共享信息。尽管这种变化违反了NERF方法中的严格和有意识的依赖性外观和无关的密度估计的分离,但我们表明它改善了新型观点的综合。我们还引入了一种替代性亚采样策略,该策略共享计算,同时最大程度地减少视图不变性的侵犯。 UNERF是原始NERF网络的插件模块。我们的主要贡献包括减少记忆足迹,提高准确性以及在训练和推理期间摊销的处理时间减少。在当地的假设较弱的情况下,我们在各种神经辐射场任务上实现了改进的资源利用。我们演示了对静态场景的新观点综合以及动态人类形状和运动的应用。
translated by 谷歌翻译
由于神经网络在关键领域起着越来越重要的作用,因此解释网络预测已成为关键研究主题。反事实解释可以帮助理解为什么分类器模型决定特定类分配的原因,此外,还必须如何修改各自的输入样本,以使类预测发生变化。先前的方法主要关注图像和表格数据。在这项工作中,我们提出了Sparce,这是一种生成对抗网络(GAN)体系结构,为多元时间序列生成稀疏的反事实解释。我们的方法提供了一个自定义的稀疏层,并根据相似性,稀疏性和轨迹的平滑性来规范反事实损失函数。我们评估了现实世界人类运动数据集的方法以及合成时间序列的可解释性基准。尽管我们比其他方法进行了明显的稀疏修改,但我们在所有指标上实现了可比或更好的性能。此外,我们证明我们的方法主要会修改显着的时间步骤和功能,从而使非征收输入未被触及。
translated by 谷歌翻译
诸如关键点之类的结构化表示形式被广泛用于姿势传输,条件图像生成,动画和3D重建。但是,他们的监督学习需要每个目标域的昂贵注释。我们提出了一种自我监督的方法,该方法学会从外观上脱离对象结构,并用直边链接的2D关键点的图形。只有描绘同一对象类的图像集合,都学会了关键点的位置及其成对边缘权重。该图是可以解释的,例如,当应用于显示人的图像时,自动链接会恢复人类骨架拓扑。我们的关键要素是i)一个编码器,该编码器可预测输入图像中的关键点位置,ii)共享图作为一个潜在变量,该图形在每个图像中链接了相同的对键点,iii)一个中间边缘映射,结合了潜在图形边缘权重和关键点的位置以柔软,可区分的方式以及iv)在随机掩盖的图像上的介入目标。尽管更简单,但自动链接在已建立的关键点上优于现有的自我监督方法,并构成估计基准,并为更多样化的数据集上的结构调节生成模型铺平了道路。
translated by 谷歌翻译
伤害分析可能是基于深度学习的人类姿势估计的最有益的应用之一。为了促进进一步研究本主题,我们为高山滑雪提供了伤害特定的2D数据集,总计533个图像。我们进一步提出了一个后处理程序,它将旋转信息与简单的运动模型相结合。我们可以将秋季情况的检测结果提高到21%,关于pck@0.2指标。
translated by 谷歌翻译